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Abstract 


Obiettivo del contributo é offrire differenti spunti di riflessione per indagare il fenomeno recente e 
gia largamente diffuso delle immagini prodotte da generatori di immagini basati su algoritmi di Intelli 
genza Artificiale Text-To-Image. Questi ultimi permettono di generare un'immagine digitale partendo 
dall'inserimento nella barra di riferimento di un testo scritto denominato prompt. Questa opportu- 
nità è decisamente esito di una velocità di progresso tecnologico, che cavalca a ritmi vertiginosi e 
impone sempre più interrogativi sullo stato delle cose e della realtà al contorno. In questo periodo, 
anche nell'ambito della rappresentazione visiva tutto appare costantemente transitorio e sottoposto 
a una velocità di aggiornamento delle possibilità, che rende l'oggi differente da ciò che era possibile 
svolgere ieri e che sarà domani. In tal senso, appare difficile definire, ora, ciò che sarà in futuro. L'esten- 
sione delle applicazioni degli algoritmi di AI a campi spiccatamente sensibili ha suscitato l'insorgere 
di numerose incertezze sia sul piano etico che sociale. Di conseguenza, supponendo che la risposta 
della macchina all'atto di inserire l'input comporti l'elaborazione di un'immagine visiva inaspettata o 
differente da quanto immaginato, risulta necessario porsi una domanda: chi può considerarsi autore 
tra l'unità carbonio e la macchina? 
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Fig. |. Immagini di robot 
cibernetici. Elaborazione 
personale tramite 
algoritmi Text-To-Image 
(sistema Midjourney - RI). 


Fig. 2. Rappresentazione 
in stile grafico ‘a matita’ 
di una Moka espresso. 
Elaborazione personale 
tramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


Introduzione 


Negli ultimi anni, si è passati dal considerare gli algoritmi di Intelligenza Artificiale (Al) da 
metodo matematico, di cui valersi per abilitare i computer a svolgere automaticamente 
compiti predefiniti tramite l'inserimento di input codificati, a entità autonome in grado di 
apprendere da banche dati digitali e fornire nuove soluzioni che sembrano non appartenere 
esclusivamente all'ambito meccanico. Così, il raggio di azione dell’Al è giunto a interessare di- 
scipline creative come il Disegno, da sempre ritenuto espressione visiva della mente umana. 
In ambito visuale, la qualità dei risultati ottenuti da questi algoritmi è tale che sembra abbia- 
no eliminato la percezione di trovarsi nella cosiddetta ‘valle perturbante’, termine coniato 
da Masahiro Nori [Nori 2012] per descrivere la sensazione che si genera negli esseri umani 
quando entità artificiali manifestano palesemente la provenienza non umana, nonostante le 


loro fattezze o le loro funzioni inducano a pensare il contrario (fig. 1). 


Oggi, probabilmente, ciò che disorienta di questi algoritmi è la loro competizione con le 
capacità umane, apparendo entità capaci di replicare le facoltà più selettive, che da sempre 
contraddistinguono la specie umana, mettendo in discussione l'autonomia di chi compie 
l'azione immaginativa, punto nodale dell'attività creativa di un disegnatore [De Rosa 201 |, 
pp. 95-103]. 

Ci si chiede, pertanto, e si stenta a fornire una risposta certa, se l'introduzione degli algo- 
ritmi Text-To-Image, tramite cui è possibile generare un'immagine inserendo nella barra di 
riferimento un prompt [1], rischi di relegare il ruolo del progettista alla sola scelta accurata 
di un lessico necessario per la stesura del prompt e non all'elaborazione critica tramite segni 
grafici di un'idea creativa: uno spazio urbano; architettonico; un oggetto di design; ecc. (fig. 2). 
L'applicazione di questi algoritmi a domini altamente sensibili è causa della sopraggiunta 
di molteplici quesiti in campi di varia natura. Infatti, se all'atto di inserire l'input descrittivo 


+ 


corrisponde una risposta della macchina consistente nell'elaborazione di un'immagine visiva 
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Fig. 3. Prompt ‘creativity 
and imagination”. 
Elaborazione personale 
tramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


che, quasi sempre, appare inaspettata o altro da ciò che si era visualizzato nella mente, chi 
può considerarsi ‘autore’ dell'immagine digitale: l'unità carbonio (per dirla secondo la fanta- 
scientifica visione in Star Trek) o la macchina? 

In questi anni recenti, differenti avvenimenti hanno messo in discussione l'attribuzione e 
l'originalità dell'opera umana. Nel 2016, il progetto The Next Rembrandt dimostrò quanto 
l'uso dell’Al fosse in grado di generare un ritratto estremamente accurato e secondo lo 
stile di Rembrandt, prodotto tramite il ricorso alle più avanzate tecnologie di produzione 
di immagini materiche per riprodurre gesti e pennellate del pittore [2]. Nel 2018, fu invece 
venduto il primo ritratto realizzato da un sistema dotato di Al e intitolato Edmond de Be- 
lamy. La criticità riposta nell'uso di sistemi basati su Al per generare immagini visive assume 
oggi ancor più significato in virtù del fatto che il software è accessibile a tutti (per esempio, 
Midjourney o DALL-E2). 

Obiettivo di questo contributo è analizzare il fenomeno dal punto di vista del disciplinare 
del Disegno. In particolare, esaminando le oramai tante immagini digitali prodotte in campo 


figurativo da generatori di immagini basati su algoritmi Text-To-Image (fig. 3), interrogarsi su 
una questione sostanziale: è giunto il momento di affermare che le macchine hanno una 
propria autonomia creativa? 


Intelligenza Artificiale e creatività 


L'Intelligenza Artificiale è un tema storicamente e scientificamente complesso. Ciò a cui mira 
questa scienza, sin dalla sua nascita negli anni ‘50 del XX secolo [Turing 1950], è produrre 
una macchina in cui si riflettano appieno le capacità umane con l'eccezione di quelle appar- 
tenenti al campo della creatività che, essendo ritenute facoltà cognitive superiori unicamen- 
te antropiche, appaiono allo stato dell'arte ancora improbabili. 

Sul finire dello scorso Millennio erano evidenti gli sforzi compiuti nel campo informatico 
e in quello dell’Al per produrre sistemi di notevole valore scientifico, stigmatizzando il di- 
vario rispetto alla cognizione umana. Ad esempio, se è indubbio che l'avvento di software 
e hardware capaci di replicare supporti e strumenti fisici per il disegno tecnico e artistico 
abbia modificato la teoria e la pratica della rappresentazione, inducendo a profonde rifles- 
sioni sulla possibilità o meno che ciò determinasse un salto di paradigma [Vita 2021, pp. 
2740-2759], quello che risulta palese è che tramite questi sistemi le capacità di ideazione e 
gestione dell'idea e dell’elaborazione creativa siano interamente demandate all'essere uma- 
no. Circostanza che, attualmente, appare modificata nell'uso di algoritmi di Al [Miller 2019]. 
Poco meno di un decennio fa, nel campo visuale Leon Gatys [Gatys 2016a, p. 326; Gatys 
2016b, pp. 2414-2423] introdusse ciò che è stato denominato image style transfer ovvero 
addestramento di una rete neurale per mappare lo stile di un'immagine su un'altra. Paralle- 
lamente furono sviluppati altri sistemi per generare automaticamente immagini. Per esem- 
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Fig. 4. Volti umani di 
persone mai esistite. 
Elaborazione personale 
tramite algoritmi di 
Intelligenza Artificiale. 
<https://thispersondoe- 
snotexist.com>. 


Fig. 5. Da sinistra a 
destra: acquerello di due 
bambine che corrono in 
giardino e in lontananza 
‘abitazione di campagna; 
studio del volto femminile 
alla maniera di Botticelli; 
cavalli che corrono 


Elaborazione personale 
ramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


iberamente nella prateria. 


pio, tramite le reti generative avversarie (Generative Adversarial Network, GAN) fu possibile 
convertire uno schizzo in fotografia, ma anche migliorare la composizione grafica di falsi 
volti fotorealistici tramite un'applicazione molto nota e diffusa, thispersondoesnotexist (fig. 4). 
In verità, applicazioni di Al che generavano volti a partire da database con migliaia di fotogra- 
fie esistevano già, ma i volti erano troppo ideali al punto da sembrare innaturali. Sfruttando 
il principio delle GAN, secondo cui due reti neurali dialogando fra loro apprendono conti- 
nuamente l'una dall'altra, e ampliando la disponibilità di dati si rende possibile la generazione 
di volti realistici mai esistiti, replicando non solo la realtà, ma anche il modo in cui l'umano 
la rappresenterebbe. Recentemente, un altro avvenimento correlato all’Al ha sconvolto il 
mondo della creatività artistica essendo diventato possibile da parte dell’A! generare imma- 
gini da una stringa testuale grazie agli algoritmi Text-To-Image. 


Il connubio fra le reti convolutive (insieme di algoritmi che apprende direttamente dai dati, 
eliminando la necessità di estrarre manualmente le caratteristiche) e i language models (le 
prime, utilizzate per individuare pattern nelle immagini per il riconoscimento di oggetti; | 
secondi, per la traduzione automatica) ha consentito lo sviluppo di numerose applicazioni 
artificiali automatiche per generare sommari, descrizioni di immagini e/o filmati, articoli di 
giornale e romanzi. Inoltre, nel 2021 un team di OpenAl ha sperimentato questi automati- 
smi in campo artistico plasmando un modello di linguaggio per la rappresentazione grafica, 
attentamente irrobustito per la parte convolutiva della visione [3] (fig. 5). Difatti, all'attualità 
esistono diversi generatori di immagini visive, addestrati per essere diversamente perfor 
manti in determinati stili e generi piuttosto che in altri.Ad ogni modo, nonostante le singole 
peculiarità, il loro uso impone sempre più domande universali: chi è l'autore fra macchina e 
uomo? La macchina esegue esclusivamente il comando impartito o compie delle scelte? Il 
processo creativo da parte della macchina è automatico o autonomo? 
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Fig. 6. Figure geometriche 
impossibili in bianco 

e nero. Elaborazione 
personale tramite 
algoritmi Text-To-Image 
(sistema Midjourney-RI). 


Fig. 7. Creatività 
artificiale. Elaborazione 
personale tramite 
algoritmi Text-To-Image 
(sistema Midjourney-RI). 


Algoritmi Text-to-Image. Automatismo o Autonomia? 


Chiedersi se le macchine abbiano raggiunto l'autonomia porta con sé un celato rimando 
alla fantascienza e manifesta immagini mentali di cyborg dalle sembianze e comportamenti 
umani, tali da dimostrare un'intelligenza che va ben oltre quella umana. Per costruire un pen- 
siero solido su ciò che sta accadendo nel mondo della rappresentazione con l'avvento degli 
algoritmi Text-To-Image è necessario staccarsi da questa visione apocalittica e riflettere sul 
ruolo del pensiero umano e di come esso si sia modificato (o lo stia per fare) nel contesto 
tecnologico [Lombardi 2018]. Un percorso necessario, non privo di ostacoli e che manifesta 
l'insorgere di numerose contraddizioni (fig. 6). 


F 


| ruolo fondamentale del pensiero umano e la sua centralità nel processo ideativo sono 
sempre rimasti costanti nel corso della storia delle innovazioni. L'avvento di strumenti e 
tecnologie non ha mai avuto una portata tale da far mettere seriamente in discussione il 
proprio ruolo cognitivo rispetto a una macchina; tant'è che si ritiene che |’Al può imitare gli 
umani, aumentare | loro risultati, affiancarli nelle mansioni ripetitive, ma non può generare 
autentiche idee creative [Piccolo 2023]. 

Probabilmente, ciò che induce a ritenere che sia impossibile replicare la creatività umana è 
che essa è un'esperienza intimamente complicata e fortemente legata a ciò che si vive e alle 
sensazioni che si provano. Pertanto, non può essere codificata e riprodotta artificialmente. 
Però, questo concetto esclude la possibilità concreta che ciò che stia nascendo non è la 
replica della creatività umana bensì una facoltà a sé stante che, con un parallelismo provo- 


catorio, si potrebbe denominare ‘creatività artificiale’ (fig. 7). 


Effettivamente il funzionamento della mente umana, che prevede una sorta di predisposi- 
zione naturale a scomporre e ricomporre immagini mentali per rispondere alle continue 
domande e agli incessanti mutamenti del mondo esterno, non è eccessivamente dissimile 
da quello dell’Al di un generatore di immagini, che presuppone da parte della macchina una 
ricerca nel copioso database visivo-linguistico di base per l'individuazione di fonti da scom- 
porre e ricomporre per la configurazione di nuove immagini digitali, che rispondano alla 
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Fig. 8. Paesaggi naturali 
fotorealistici. Elaborazione 
personale tramite algorit- 
mi Text-To-Image (sistema 
Midjourney-RI). 


Fig.9. Studio di meduse 
trasparenti e della luce 
sott'acqua. Elaborazione 
personale tramite 
algoritmi Text-To-Image 
(sistema Midjourney-RI). 


richiesta testuale [Pearl, Mackenzie 2019]. Da quest’analisi superficiale emerge che, esclu- 
dendo la differente natura delle singole componenti coinvolte (biologiche, nel primo caso; 
artificiali, nel secondo), il processo di elaborazione è lo stesso e l'autonomia e la possibilità 
di scelta risiede in noi come in una macchina (fig. 8). 

Ad ogni modo, attuando una riflessione più approfondita e richiamando ulteriori fattori, le 
riflessioni si modificano. Ciò che muove l'uomo è la motivazione e la volontà di approfondi- 
re la realtà e registrarla tramite le immagini, in maniera più o meno reale. L'elaborazione di 
queste ultime presuppone un progetto mosso da un intento: la consapevolezza di risponde- 
re a una richiesta di conoscenza. Inoltre, la costruzione di un'immagine non deriva solo dalla 
scomposizione e ricomposizione di altri elementi visivi, a noi già noti, ma dall'interazione 
dei nostri sensi: un odore può far affiorare il ricordo di un'esperienza; il tocco di differenti 
materiali può provocare l'associazione a pattern diversi; ecc. 

Le immagini prodotte sono il risultato di esperienze multisensoriali, a differenza (al momen- 
to) di quelle generate dall'Al, che sono unidirezionali e derivanti dalle sole immagini digitali 
già esistenti [Bianca 2009]. In quest'ottica, la macchina non è un'entità creativa autonoma, ma 
tramite la capacità di calcolo con cui è stata programmata sta semplicemente rispondendo 
alla richiesta formulatele (fig, 9). 


Insomma, un'attività automatica e non autonoma. Eppure, ciò che avviene in quel breve 
lasso di tempo che intercorre fra l'inserimento del prompt e la risposta configurata dalla 
macchina, sembrerebbe ancora non del tutto chiaro. 

Come precedentemente detto, addestrandosi fra loro, più reti neurali si modificano, miglio- 
rano e giungono a risultati spesso inaspettati. Gli stessi sviluppatori di alcune di queste piat- 
taforme hanno dichiarato che le hanno rese aperte al fine di condividere il più possibile le 
immagini generate per capire come l'Al ‘operi’ per la loro produzione. Dunque, al momento 
appare incauto dare una risposta decisa alla domanda iniziale: autonomo o automatico? Ma 
è indiscutibile che l'avvento di questi algoritmi rappresenti per la disciplina del Disegno un 
momento di transito che probabilmente condurrà ad un tempo quasi totalmente digitale 


(fig. 10). 
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Fig. 10. Visioni future 
del connubio tra 
Intelligenza Artificiale e 


lo stile ‘disegno a matita’. 


Elaborazione personale 
tramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


Fig. | |. Declinazioni 
differenti di temi 

in ambito moda. 
Elaborazione personale 
tramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


Conclusione 


Provare a quantificare il numero di immagini prodotte da generatori di Al è un compito at- 
tualmente impossibile. Indubbiamente, bisogna considerare che siano milioni se non miliardi 
di immagini, e il dato è ancor più impressionante se paragonato al numero di mesi che sono 
trascorsi da quando questi sistemi sono stati resi accessibili (fig. | 1). 


Un evento che non può essere trascurato e con cui dobbiamo dialogare, visto che la dif- 
fusione e l'uso costante di questo sistema hanno permesso di raggiungere risultati impres- 
sionanti. Se, infatti, le prime elaborazioni apparivano rudimentali e con regole geometriche 
e compositive spesso errate, oggi l'esperienza maturata restituisce sempre più immagini 
visive che sembrano scaturire da processi di analisi ponderati e sapienti. Tuttavia, le opinioni 
su questo contesto sono alquanto contrastanti: da una parte, curiosità e apertura; dall'altra, 
incredulità e ripudio [Sayag 2019; Plebe 2022]. Altro aspetto interessante è il successo di 
questi sistemi basati su Al e la moltiplicazione di progetti paralleli favoriti da questi ‘motori di 
creatività attraverso cui elaborare concept grafici, fondendo fra loro dati che all'apparenza 
sembrerebbero non avere nulla in comune. Questo rapido e diffuso interesse ha intensifi- 
cato la rete di modelli, applicazioni e piattaforme, immaginando una prospettiva concreta e 
futura in più campi di ricerca come: elaborazione di fumetti; cortometraggi e look book ani- 
mati; progettazione di prodotti di design; ecc. Ciò stante, in questo panorama di ricerca ed 
evoluzione tecnologica, due aspetti rimangono profondamenti sensibili: la qualità dei risultati 
fonda sull'uso sapiente di linguaggi e processi di post-elaborazione proposti alla macchina; il 
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Fig. 12. Studio delle 


figure impossibili a calori. 


Elaborazione personale 
tramite algoritmi 
Text-To-Image (sistema 
Midjourney-RI). 


significato delle immagini, profondo o superficiale che sia, esiste solo se correlato a un'inter- 
pretazione sensibile (fig. | 2). Probabilmente, questa considerazione costituisce uno dei punti 
fondamentali in cui si manifesta la condizione di transitorietà nel contesto attuale. A oggi, 
non è possibile affermare che l'immagine digitale generata abbia un significato proprio, né 
che la macchina abbia la capacità di comprendere ciò che ha prodotto oppure di migliorarlo 
rispetto a un'aspettativa altra. Ciò che si visualizza nella mente non è ciò che si genera, tant'è 
che per migliorarlo si ricorre alla fase di post-elaborazione. 

Allo stato dell'arte, la domanda da porsi è la seguente: in un prossimo futuro, le immagini 
prodotte dai generatori di Al avranno un ruolo autonomo a prescindere dall'intervento 
umano necessario ad azionarli? 


Crediti 
Questo contributo è il risultato comune di studi, riflessioni e applicazioni da parte delle Autrici sul tema dell'Intelligenza Ar- 
tificiale applicata all'elaborazione creativa nel campo del Disegno. Tuttavia, le parti del contributo sono attribuibili a: Ornella 


Zerlenga, per lIntroduzione’ e per le ‘Conclusioni’; Rosina laderosa, per i paragrafi ‘Intelligenza Artificiale e creatività’, ‘Algoritmi 
Text-to-Image. Automatismo o Autonomia?” 


Note 


[I] Vale a dire un testo descrittivo e/o delle parole-chiave. Un input da fornire all'Al. 


[2] <https://www.ieroglifo.com/202 1/05/19/il-prossimo-rembrandt/>. 


[3] <https://www.focus.it/tecnologia/digital-life/primo-libro-intelligenza-artificiale-rocco-tanica>. 
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Abstract 


The aim of the contribution is to offer different insights to investigate the recent and already wide- 
spread phenomenon of images which are produced by image generators based on algorithms of Ar- 
tificial Intelligence Text-To-Image. These algorithms allow to generate a digital image by starting from 
the insertion in the reference bar of a written text called prompt.This chance is the result of a speed 
of technological progress which rides at a dizzying pace and imposes more and more questions about 
the state of things and the surrounding reality. In this time, even in the field of visual representation 
everything appears constantly transient and subjected to a speed of updating of possibilities, making 
today feasible different from what yesterday was possible and that tomorrow will be. In this regard, 
it seems difficult to define now what will be in the future. Numerous doubts and issues, both ethical 
and societal, have arisen as a result of the expansion of Al's algorithms to highly sensitive domains. 
IConsequently, if it is supposed that the machine's response to the act of inserting the descriptive 
input involves the processing of a visual image that, almost always, appears unexpected or different 
from what was displayed in the mind, it needs to ask the following question: who can be considered 
the ‘author’ of the digital image between the carbon unit and the machine? 
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Fig. |. Images of 
cybernetic robots. 
Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


Fig. 2. Graphic “pencil” 
style representation 

of an express Moka. 
Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


Introduction 


In recent years, it was moved from consideration that the algorithms of Artificial Intelligence 
(Al) are a mathematical method to be used to enable computers to automatically perform 
predefined tasks by inserting encoded inputs to autonomous entities which are able to 
learn from digital databases and provide new solutions that don’t seem to belong exclu- 
sively to the mechanical field. Thus, the range of action of Al has come to interest creative 
disciplines such as Drawing, which has always been considered as a visual expression of the 
human mind. 
In the visual field, the quality of the results obtained by these algorithms is such that they 
seem to have eliminated the perception of being in the so-called ‘disturbing valley’, a term 
coined by Masahiro Nori [2012] in order to describe the sensation that is generated in hu- 
man beings when artificial entities clearly manifest non-human origin, despite their features 
or their functions lead to the opposite thoughts (fig. |). 


Nowadays, what probably confuses in regard of these algorithms is their competition with 
human capabilities, since they appear as replicas of the most selective faculties that have 
always distinguished the human species by raising concerns about the autonomy of those 
who perform imaginative action which is the focal point of designer's creative process [De 
Rosa 2011, pp. 95-103]. 
Therefore, one wonders, but it is difficult to give a certain answer, if the introduction of the 
Text-To-Image algorithms through which it is possible to generate an image by inserting a 
prompt in the reference bar [1] risks of relegating the role of the designer to the unique 
careful choice of a lexicon that is necessary for the drafting of the prompt and to exclude 
the critical processing through graphic signs of a creative idea: an urban space; architectural; 
a design object; etc. (fig. 2). 
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Fig. 3. Prompt “creativity 
and imagination”. 
Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


The application of these algorithms to highly sensitive domains is due to the occurrence of 
multiple inquiries in various fields. In fact, if it is supposed that the machine's response to the 
act of inserting the descriptive input involves the processing of a visual image that, almost 
always, appears unexpected or different from what was displayed in the mind, it needs to 
know who can be considered the ‘author’ of the digital image and to ask the following ques- 
tion: the carbon unit (according to the sci-fi vision in Star Trek) or the machine? 

In recent years, different events have created questions about the attribution and originality 
of human work. In 2016, the project The Next Rembrandt demonstrated how the use of 
Al was able to generate an extremely accurate portrait in Rembrandt's style that was pro- 
duced through the use of the most advanced technologies of production of material images 
in order to reproduce gestures and brushstrokes of the painter [2]. In 2018, it was sold 
the first portrait made by a system equipped with Al and entitled Edmond de Belamy. The 
criticality of using Al-based systems to generate visual images is even more significant today 
because the software is accessible to everyone (for example, Midjourney or DALL-E2). 
The objective of this contribution is to analyze the phenomenon from the point of view 

of the specification of the Drawing. In particular, it occurs to ask for a substantial question 
by examining the many digital images which are produced in the figurative field by image 
generators based on Text-To-Image algorithms (fig, 3): Is it the time to say that machines 
have their own creative autonomy? 


Artificial Intelligence and creativity 


Al is a historically and scientifically complex topic. Till its inception in the 1950s [Turing 
1950], this science aims to produce a machine in which human abilities are fully reflected 
except for those belonging to the field of creativity that appear to the state of the art still 
unlikely since they are considered higher cognitive faculties only anthropic. 

Towards the end of the last millennium, efforts in the field of information technology and 
Al were evident in order to produce systems of considerable scientific value, stigmatizing 
the gap in respect of human cognition. For example, it is no doubt that the advent of soft- 
ware and hardware capable of replicating physical media and tools for technical and artistic 
drawing has changed the theory and practice of representation, inducing deep reflections 
about the possibility if this would lead to a paradigm shift or not [Vita 2021, pp. 2740-2759]. 
It is also evident that, through these systems, the ability to conceive and manage the idea 
and creative elaboration is entirely left to the human being. It is a circumstance that appears 
currently modified in the use of algorithms of Al [Miller 2019]. 

About ten years ago, in the field of vision Leon Gatys [Gatys 201 6a, p. 326; Gatys 201 6b, 
pp. 2414-2423] introduced what has been called image style transfer or training of a neural 
network to map the style of an image over another Other systems were contemporary 
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Fig. 4. People's human 
faces never existed. 
Personal processing by 
Artificial Intelligence 
algorithms (RI). 


<https://thispersondoe- 


snotexist.com>. 


Fig. 5. From left to right: 
watercolor of two babies 
running in the garden 
and in the distance the 
country house; study 

of the female face in 

the manner of Botticelli: 
horses running freely 

in the plain. Personal 
processing via Text- 
To-Image algorithms 
(Midjourney system - RI). 


developed to automatically generate images. For example, through the Generative Adver- 
sarial Network (GAN) it was possible to convert a sketch into a photograph but also to 
improve the graphic composition of photorealistic false faces through a very well-known 
and widespread application, thispersondoesnotexist (fig. 4). 

Indeed, Al applications that generated faces from databases with thousands of photographs 


were already existing but the faces were so ideal so seemed unnatural. By exploiting the 
principle of GAN, according to which two neural networks communicate and learn con- 
tinuously each other, and expanding the availability of data it is possible the generation of 
realistic faces never existed, replicating not only reality, but also the way on the base of 
which human would represent it. Recently, another Al-related event disrupted the world of 
artistic creativity as it became possible for Al to generate images from a text string using 
Text-To-lmage algorithms. The combination of convolutive networks (a set of algorithms 
that directly learns from data by eliminating the need to extract features manually) and 
language models (the former, used to detect patterns in images for object recognition; the 
latter, for machine translation) allowed the development of numerous automatic artificial 
applications to generate summaries, image descriptions and/or movies, newspaper articles 
and novels. In addition, in 2021 an OpenAl team experimented these automatisms in the 
artistic field by creating a language model for graphic representation, strengthened carefully 
for the convolutive part of the vision [3] (fig. 5). In fact, there are several current visual 
image generators, trained to be performing differently in certain styles and genres rather 
than in others. However, despite of the individual peculiarities, their use imposes more and 
more universal questions: who is the author between machine and man? Does the machine 
only execute the command given or make choices? Is the creative process automatic or 
autonomous by the machine? 
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Fig. 6. Impossible 
geometric figures in 
black and white. Personal 
processing via Text- 
To-Image algorithms 
(Midjourney system - RI). 


Fig. 7. Artificial creativity. 
Personal processing via 

Text-To-Image algorithms 
(Midjourney system - RI). 


Text-to-Image algorithms.Automatism or Autonomy? 


Wondering if the machines have reached autonomy brings with it a hidden reference to 
science fiction and manifests mental images of cyborgs with human appearance and behav- 
ior, such as to demonstrate an intelligence going beyond the human one. In order to build a 
solid thought on what is happening in the world of representation with the advent of Text- 
To-Image algorithms it is necessary to break away from this apocalyptic vision and reflect 
on the role of human thought and how it has changed (or is about to) in the technological 
context [Lombardi 2018]. It is a necessary path, not without obstacles and that manifests 
the rise of numerous contradictions (fig. 6). 


The fundamental role of human thought and its centrality in the ideational process have 
always remained constant throughout the history of innovation. The advent of tools and 
technologies has never been so far-reaching as to seriously question its cognitive role in 
respect to a machine; it was always believed that Al can imitate humans, increase their re- 
sults, support them in repetitive tasks but cannot generate authentic creative ideas [Piccolo 
2023]. 
What probably leads us to believe impossible to replicate human creativity is due to an 
experience that is intimately complicated and strongly linked to what we live and to the 
sensations we practise. Therefore, it cannot be encoded and reproduced artificially. Howev- 
er this concept excludes the concrete possibility that what is being born is not the replica 
of human creativity but a faculty in itself that could be called ‘artificial creativity’ with a 
provocative parallelism (fig. 7). 
Really, the functioning of the human mind, which provides a kind of natural predisposition 
to decompose and reassemble mental images to answer the continuous questions and the 
incessant changes of the external world, it is not too different from the Al of an image gen- 
erator which requires the machine to search through the copious visual-linguistic database 
to find sources to decompose and recompose for the configuration of new digital images 
which have to answer to the textual request [Pearl & Mackenzie 2019]. 
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Fig. 8. Photorealistic 
natural landscapes. 
Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


Fig. 9. Study of 
transparent jellyfish 

and underwater light. 
Personal processing via 
Text-To-Image algorithms 
(Midjourney system- RI). 


From this surface analysis, by excluding the different nature of the individual components 
involved (biological, in the first case; artificial, in the second), it emerges that the processing 
is the same and the autonomy and choice lies in us as in a machine (fig. 8). 


However, the reflections change by carrying out a deeper reflection and recalling further 
factors. 

Man is motivated by the will to deep reality and record it through images in a more or 
less real way. The elaboration of the latter presupposes a project driven by an intention: 
the awareness of responding to a request for knowledge. Moreover, the construction of 
an image doesn't come only from the decomposition and re-composition of other visual 
elements, already known to us, but from the interaction of our senses: a smell can bring out 
the memory of an experience; the touch of different materials can result in binding to dif- 
ferent patterns; etc. The images produced are the result of multisensory experiences, unlike 
(at the moment) those generated by Al, which are unidirectional and derived from the only 
existing digital images [Bianca 2009]. In this perspective, the machine is not an autonomous 
creative entity, but through the computing capacity with which it was programmed it is sim- 
ply responding to the request formulated to it, that is an automatic and not autonomous 
activity (fig. 9). 
What happens in that short period of time between the insertion of the prompt and the 
response configured by the machine doesn't seem entirely clear indeed. As it was previ- 
ously mentioned, by learning each other more neural networks change, improve and of- 
ten arrive at unexpected results. The same developers of some of these platforms stated 
that they made them open in order to share as much as possible the images generated to 
understand how Al ‘operates’ for their production. So, now it seems unwise to give a firm 
answer to the initial question: autonomous or automatic? But it is indisputable that the ad- 
vent of these algorithms represents for the discipline of Drawing a moment of transit that 
will probably lead to an almost totally digital time (fig, 10). 
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Fig. 10. Future visions 
of the union between 
Artificial Intelligence and 


the style “pencil drawing”. 


Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


Fig. ||. Different 
interpretations of 
fashion themes. Personal 
processing via Text- 
To-Image algorithms 
(Midjourney system- RI). 


Conclusion 


It is a task currently impossible to try and quantify the number of images produced by Al 
generators. Undoubtedly, we must consider that there are millions if not billions of images 
and the data is even more impressive when compared to the number of months passed 
since these systems were made accessible (fig. | 1). 


It is an event that cannot be neglected and with which we must dialogue since the spread 
and constant use of this system allowed us to achieve impressive results. If we consider 
that the first elaborations appeared rudimentary and with geometric and compositional 
rules often erroneous, nowadays it is possible to affirm that the experience matured re- 
turns more and more visual images that seem to spring from considered and wise analysis 
processes. 

However opinions about this context aren't agreed: on one hand, curiosity and openness; 
on the other ones, disbelief and repudiation [Sayag 2019; Plebe 2022]. Another interesting 
aspect is the success of these Al-based systems and the multiplication of parallel proj- 
ects that are favoured by these ‘creative engines’ through which we can elaborate graphic 
concepts by merging data that have nothing in common, apparently. This rapid and wide- 
spread interest intensified the network of models, applications and platforms by imagining 
a concrete and future perspective in different fields of research such as: comics processing; 
animated short films and look books; design products; etc. Nevertheless, in a panorama like 
this, two aspects remain sensitive depths: the quality of the results is based on the wise use 
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Fig. 12. Study of the 


figures impossible to heat. 


Personal processing via 
Text-To-Image algorithms 
(Midjourney system - RI). 


of languages and post-processing processes proposed to the machine; the meaning of the 
images, either deep or superficial, exists only if correlated to a sensitive interpretation (fig. 
12). This consideration is probably one of the fundamental points in which the transitory 
condition in the current context manifests itself. Nowadays, it is not possible to say that the 
digital image generated has a meaning of its own, nor that the machine has the ability to un- 
derstand what it has produced or to improve it in respect to a different expectation. What 
is displayed in the mind is not what is generated; in fact, in order to improve it we resort to 
the post-processing phase. 

At the state-of-the-art, it occurs the following question: in the near future, will the images 
produced by Al generators have an autonomous role regardless of the human intervention 
necessary to operate them? 


` ja & \\ 


Credits 
This contribution is the common result of studies, reflections and applications by the Authors about the theme of Artificial 
Intelligence applied to creative elaboration in the field of Drawing. However, parts of the contribution are attributable to: 


Ornella Zerlenga, for the ‘Introduction’ and the ‘Conclusions’; Rosina laderosa, for the paragraphs ‘Artificial Intelligence and 
creativity’ and ‘Text-to-Image algorithms. Automatism or Autonomy?’. 


Notes 


[I] That is a descriptive written text and/or words-key. 


[2] <https://www.ieroglifo.com/202 1/05/19/il-prossimo-rembrandt/>. 


[2] <https://www.focus.it/tecnologia/digital-life/primo-libro-intelligenza-artificiale-rocco-tanica>. 
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Il volume, dedicato al 44° Convegno Internazionale della Unione Italiana per 
il Disegno, indaga il tema delle ‘transizioni’ che rappresenta in modo parti- 
colarmente efficace il nostro tempo e l’attuale condizione dell'ambito disci- 
plinare del Disegno. Il termine, al di là del suo significato generico di fase 
intermedia di un processo in cui si muta una condizione da uno stato a un 
altro, è stato sempre usato in diversi campi, dalla musica alla geofisica. In 
realtà le discipline del Disegno si sono sempre confrontate con temi e que- 
stioni relativi a passaggi da una condizione a un’altra. La storia della rappre- 
sentazione ci racconta di trasformazioni, anche epocali, relative al ‘disegna- 
re’, con tutto ciò che il transire comporta: basti pensare all'evoluzione delle 
forme della rappresentazione, degli apparati strumentali, alla mutevolezza 
dei supporti, alla transizione analogico-digitale in atto, alle nuove modalità di 
comunicazione su piattaforme, all'offerta ipertrofica di immagini anche in rete 
che conferma le intuizioni di Guy Debord relative alla nuova spettacolarizza- 
zione della società. Analogamente la rappresentazione innesca transizioni 
nella prefigurazione e nella comunicazione del progetto, anticipazione e pre- 
annuncio di eventi futuri. 

Le sfide proposte dal digitale pongono questioni ancora aperte delle quali si 
può soltanto intravedere la portata, come per esempio il rapporto tra il dise- 
gno e l’atto del modellare, e la costruzione di nuovi paradigmi del linguaggio 
visivo e della comunicazione. 

‘Transizioni’, quasi implicitamente, indica futuri possibili, evoluzione di tec- 
nica e ricerca di nuove modalità espressive; allo stesso modo, però, può 
suggerire silenzi e riflessioni in un processo di raccordo tra storia, teoria, 
critica e costruzione. 


The volume, dedicated to the 44th International Conference of the Italian Union 
for Drawing, investigates the theme of ‘Transitions’, which particularly effective- 
y represents our time and the current condition of the discipline of Drawing. 
The term, beyond its generic meaning of an intermediate stage in a process in 
which a condition changes from one state to another, has always been used 
in various fields, from music to geophysics. In fact, the disciplines of drawing 
have always been confronted with themes and issues relating to transitions 
from one condition to another. The history of representation tells us of trans- 
ormations, even epochal ones, relating to ‘drawing’, with all that such tran- 
sitions entail: suffice it to think of the evolution of forms of representation, of 
instrumental apparatuses, of the mutability of supports, of the analogical-digital 
transition underway, of the new modes of communication on platforms, of the 
hypertrophic offer of images also on the net that confirms Guy Debord’s intu- 
itions relating to the new spectacularisation of society. Similarly, representa- 
tion triggers transitions in the prefiguration and communication of design, the 
anticipation and foreshadowing of future events.The challenges posed by the 
digital pose open questions whose scope can only be glimpsed, such as the 
relationship between drawing and the act of modelling, and the construction 
of new paradigms of visual language and communication. ‘Transitions’, almost 
implicitly, points to possible futures, the evolution of technique and the search 
for new modes of expression; at the same time, however, it can suggest silenc- 
es and reflections in a process of connection between history, theory, criticism 
and construction. 
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